পাঁচ সংখ্যা সার হলো ডেটাসেটের সার্বিক বৈশিষ্ট্য বোঝানোর একটি পরিসংখ্যানিক পদ্ধতি। এটি ডেটাসেটের কেন্দ্রীয় প্রবণতা এবং বৈচিত্র্যের একটি ধারণা দেয়। পাঁচ সংখ্যা সার সাধারণত ডেটার পাঁচটি নির্দিষ্ট মান নিয়ে গঠিত:
১. সর্বনিম্ন মান (Minimum):
ডেটাসেটের মধ্যে সর্বনিম্ন মান।
২. প্রথম চতুর্ভাগ (Q1):
ডেটাসেটের প্রথম ২৫% মান পর্যন্ত অংশের মধ্যবর্তী মান। একে নিম্ন চতুর্ভাগও বলা হয়।
৩. মধ্যক (Median বা Q2):
ডেটাসেটের কেন্দ্রস্থলে অবস্থিত মান, যা ডেটাকে দুই ভাগে বিভক্ত করে।
৪. তৃতীয় চতুর্ভাগ (Q3):
ডেটাসেটের প্রথম ৭৫% মান পর্যন্ত অংশের মধ্যবর্তী মান। একে উপরের চতুর্ভাগও বলা হয়।
৫. সর্বোচ্চ মান (Maximum):
ডেটাসেটের মধ্যে সর্বোচ্চ মান।
ডেটাসেট: 5, 7, 8, 10, 12, 15, 18, 20, 25
পাঁচ সংখ্যা সার নির্ণয়:
১. সর্বনিম্ন মান:5
২. প্রথম চতুর্ভাগ Q1: 8
৩. মধ্যক (Median): 12
৪. তৃতীয় চতুর্ভাগ (Q3): 18
৫. সর্বোচ্চ মান: 25
পাঁচ সংখ্যা সার: 5, 8, 12, 18, 25
১. ডেটার বিস্তার নির্ধারণ:
সর্বনিম্ন এবং সর্বোচ্চ মানের মাধ্যমে ডেটার বিস্তার (Range) নির্ধারণ করা যায়।
২. বণ্টন বিশ্লেষণ:
চতুর্ভাগগুলো ডেটার বণ্টন এবং বৈচিত্র্য বিশ্লেষণে সহায়ক।
৩. আউটলাইয়ার শনাক্তকরণ:
চতুর্ভাগের মাধ্যমে বহিরাগত মান বা আউটলাইয়ার শনাক্ত করা যায়।
৪. চিত্রায়ণে ব্যবহার:
বক্সপ্লট তৈরিতে পাঁচ সংখ্যা সার ব্যবহার করা হয়, যা ডেটাসেটের ভিজ্যুয়াল বিশ্লেষণে সহায়ক।
পাঁচ সংখ্যা সার একটি সহজ এবং কার্যকর পদ্ধতি যা ডেটাসেটের কেন্দ্রীয় প্রবণতা এবং বৈচিত্র্যের সার্বিক ধারণা দেয়। এটি গবেষণা, সিদ্ধান্ত গ্রহণ এবং পরিসংখ্যানিক বিশ্লেষণে গুরুত্বপূর্ণ ভূমিকা পালন করে।
আরও দেখুন...